Oppdummering av funksjoner for "søppel -DNA" støtter det nye RNA -genparadigmet
Casey Luskin, 29. november 2023. Oversatt herfra. {Understreking og kursiv ved oversetter.}
Den siste tiden har jeg dekket en ny artikkel publisert i Bioessays av den australske molekylære biologen John Mattick -lenke, som siterer behovet for et "paradigmeskifte" i biologi bort fra begrepet søppel -DNA (se her, her og her). Jeg fortalte hvordan dette skiftet blir drevet av oppdagelsen av mange "anomalier" i søppel-DNA-paradigmet som viser at ikke-proteinkodende DNA er funksjonelt. Og jeg forklarte at et nytt paradigme som anerkjenner eksistensen av "RNA -gener" begynner å erstatte det gamle søppel -DNA -paradigmet. Men Matticks artikkel er ikke det eneste stedet hvor han har forklart viktigheten av RNA -gener. I en artikkel publisert tidligere i år i Nature gjennomgår celle- og molekylærbiologi, "Lang ikke-kodende RNA: definisjoner, funksjoner, utfordringer og anbefalinger," -lenke. Mattick og et team på over 25 medforfattere forklarer de rike funksjonene til lange ikke-(protein) kodende RNA, eller “lncRNAer”:
"De fleste lncRNA utvikler seg raskere enn proteinkodende sekvenser, er celletypespesifikke og regulerer mange aspekter ved celledifferensiering og utvikling og andre fysiologiske prosesser. Mange LNCRNA-er assosieres med kromatinmodifiserende komplekser, blir transkribert fra forsterkere og nukleo-faseseparasjon av nukleære kondensater og domener, noe som indikerer en intim kobling mellom lncRNA-ekspresjon og den romlige kontrollen av genuttrykk under utvikling. IndRNA har også viktige roller i cytoplasma og utover, og er inkludert i reguleringen av oversettelse, metabolisme og signalering. IncRNA har ofte en modulær struktur og er rik på repetisjoner, som i økende grad blir vist å være relevante for deres funksjon."
..
RNA deltar i praktisk talt alle nivåer av genomorganisasjon, cellestruktur og genuttrykk, gjennom RNA - RNA, RNA - DNA og RNA - protein -interaksjoner, som ofte involverer repeterende elementer, inkludert små ispedde nukleære elementer i 3 ′ikke-translaterte regioner. Disse interaksjonene er involvert i regulering av kromatinarkitektur og transkripsjon (se senere), skjøting (spesielt av antisense LNCRNA), proteinoversettelse og lokalisering, og andre former for RNA -prosessering, redigering, lokalisering og stabilitet.
Mange lncRNA er involvert i regulering av celledifferensiering og utvikling hos dyr og planter. De har også roller i fysiologiske prosesser som (i pattedyr) den p53-medierte responsen på DNA-skade, V (d) J rekombinasjon og klassebryter rekombinasjon i immunceller, cytokinuttrykk, endotoksisk sjokk, betennelse og nevropatisk smerte, kolesterolbiosyntese Homeostase, veksthormon og prolaktinproduksjon, glukosemetabolisme, cellulær signaloverføring og transportveier, synapsefunksjon og læring, og har roller i responsen på forskjellige biotiske og abiotiske belastninger i planter. Det er også en fremvoksende assosiasjon av LNCRNA med cellemembranen og med ribozymer.
Bilde 1. Stadig nye funksjoner oppdages for 'junk-DNA'
Et feilaktig syn på funksjon
Et vanlig argument for ikke-funksjonalitet i "søppel-DNA" er at det ikke er 'bevart'. Den viser forskjellige sekvenser på tvers av forskjellige arter - som visstnok betyr at den lett tåler nøytrale mutasjoner fordi det ikke er noen funksjon for mutasjoner å skade og for seleksjon til å bevare. Dette er selvfølgelig et evolusjonært argument. Det forutsetter at grunnen til at en DNA -sekvens eksisterer i utgangspunktet er at den ble generert ved mutasjon og seleksjon. Dermed indikerer variabilitet på tvers av arter mangel på rensende seleksjon. Men hva om DNA ikke oppsto gjennom mutasjon og seleksjon? Selvfølgelig har Mattick et al. (2023) Ikke utfordret evolusjonsteorien, men de fremhever det faktum at disse "ikke-konserverte" sekvensene kan være svært funksjonelle-og kan til og med spille avgjørende roller i å spesifisere forskjellene mellom arter:
"De fleste lncRNA er mindre bevart blant arter enn mRNA -sekvensene som koder for proteomet. Opprinnelig ble det meste av pattedyrgenomet (som inkluderte flest lncRNA -loki) antatt å utvikle seg nøytralt, ved å bruke målestokken med divergens fra vanlige 'gamle repetisjoner' (avledet fra transposoner) mellom menneske- og muse- genomer, etter antagelsen om at disse sekvensene er ikke-funksjonelle og representative for den opprinnelige distribusjonen i stamfaren. Imidlertid er det økende bevis på at transponerbare elementer er vidt kooperert som funksjonelle elementer av genuttrykk og struktur, og danner promotorer, regulatoriske nettverk, eksoner og spleise-virkninger i proteinkodende gener og lncRNA, og derfor ikke kan brukes som indekser for nøytrale utvikling.
Regulatoriske sekvenser, inkludert promotører og LNCRNA, er kjent for å utvikle seg raskt på grunn av mer avslappede struktur-funksjonsbegrensninger enn proteinkodende sekvenser og på grunn av positiv seleksjon under adaptiv stråling. Mange lncRNA er cellelinje spesifikke. Gitt deres tilknytning til utviklingsforsterkere (se senere), kan variasjon i komplementet og sekvensene til LNCRNA faktisk være en viktig faktor i artsmangfoldet."
Ikke gå glipp av den siste linjen der: "Variasjon i komplementet og sekvensene til LNCRNA kan være en viktig faktor i artsmangfoldet." De sier at forskjeller mellom ikke-kodende DNA på tvers av arter ikke betyr at dette DNA er "søppel." Tvert imot, disse forskjellene indikerer at "søppelet" kan være ansvarlig for å kode forskjellene mellom arter. Med andre ord, søppel -DNA -paradigmet kan ha fått oss til å gå glipp av det nøyaktige DNA som hjelper til med å gjøre en art unik.
Bilde 2. Oppbygning og forskjeller i RNA og DNA
En spredning av nylig oppdagede funksjoner
Det er klart at dette er veldig generelle funksjoner de siterer. Men flere nylige artikler publisert i løpet av de siste årene har funnet mange spesifikke funksjoner for ikke-kodende "søppel" DNA:
*Shapiro 2022 (Biosystems): Repeterende DNA (transponerbare elementer) er ansvarlig for mange avstamningsspesifikke forskjeller-dvs. involvert i å danne nye kroppsplaner.
*Johnsson et al. 2022 (Nature Genetics): Lange ikke -kodende RNA regulerer proteinuttrykk og cellesyklusen, inkludert kontrollerende apoptose.
*Wei et al. 2022 (Cell Reports): Junk DNA er involvert i å danne fryktrelaterte minner og fobier.
*Feng et al. 2022 (Nucleic Acids Research): Pseudogener er oversatt til proteiner.
*Harding et al. 2021 (virus evolusjon): Endogene retrovirus kjemper mot viruinfeksjoner.
*Senft og MacFarlan 2021 (Nature Reviews Genetics): Repetitive DNA (Transposable Elements) kontrollerer utvikling hos pattedyr.
*Johansson et al. 2022 (cellestamcelle): Ikke-kodende søppel-DNA regulerer genuttrykk i humane og sjimpanse hjerner, og kan forklare hjerneforskjellene våre.
*Marx 2022 (Nature Methods): Ikke -kodende RNA er involvert i celledifferensiering og utvikling.
*Allou et al. 2021 (Natur): Lange ikke -koding (LNC) RNA er involvert i dannelse av lemmer.
*Sturm et al. 2023 (Nature Communications): Transponerbare elementer kontrollerer aldring.
*Yang et al. 2023 (Natur): Retrotransposoner er involvert i å regulere immunresponser.
Bilde 3. mRNA's rolle i danning av polypeptid
Nøyaktig hvor mange funksjonelle lncRNA er kjent? En 2021 -artikkel i naturen av Gates et al. -lenke bemerket at over 130 000 funksjonelle "genomiske elementer, tidligere kalt søppel DNA" nå er oppdaget. Mattick et al. gjennomgå bevis som bekrefter dette antallet:
"Godt i overkant av 100 000 menneskelige lncRNA er blitt registrert, hvorav mange er spesifikke for primatlinjen. Dette er en enormt ufullstendig liste på grunn av den begrensede analysen av forskjellige celler i forskjellige utviklingsstadier (se senere). Det er nå hundretusener av katalogiserte lncRNAer og dusinvis av databaser (og databaser av databaser) med sjekket informasjon. I løpet av det siste tiåret har det vært ca. 50 000 publikasjoner med ‘lange ikke-kodende RNA’ som et nøkkelbegrep og mer enn 2000 publikasjoner som rapporterer validerte IncRNA-funksjoner, selv om de fleste ennå ikke har blitt fulgt opp utfyllende."
For å sette pris på tempoet som funksjonelle ikke-proteinkodende genetiske elementer blir oppdaget i, må du huske å se på denne figuren fra Gates et al. (2021) -lenke. Den øverste grafen viser en oransje kurve som viser antall kjente funksjonelle ikke-proteinkodende DNA-elementer. Som du kan se, stiger kurven i det som ser ut som eksponentiell vekst.
Biologer skeptiske til funksjon
Hvordan har biologer typisk svart på dette beviset på masse-funksjonalitet for ikke-(protein)kodende DNA? Mattick et al. (2023) forklarer at de typisk var skeptiske og opprettholdt sitt engasjement for søppelparadigmet:
"Den vanlige innledende reaksjonen av molekylærbiologisamfunnet var å mistenke at disse uvanlige RNA -ene er transkripsjonell støy, på grunn av deres generelt lave nivåer av sekvensbevaring, lave ekspresjonsnivåer og lav synlighet i genetiske visninger. Siden den gang har det imidlertid skjedd en eksplosjon i antall publikasjoner som rapporterer det dynamiske uttrykket og biologiske funksjonene til IncRNA, hjulpet av omfattende teknologiutvikling som har muliggjort deres identifisering og karakterisering, selv om bare et mindretall av IncRNA har trygge merknader og veldig få har mekanistisk informasjon."
Ideen om "transkripsjonell støy" er ganske enkelt håpet om at selv om det meste av vårt DNA blir transkribert til RNA, er dette RNA i seg selv søppel. Så vi har ganske enkelt flyttet argumentet fra søppel -DNA til søppel -RNA. Men de vanlige argumentene for dette er svake. Som vi så, indikerer ikke lav sekvens bevaring nødvendigvis mangel på funksjonalitet. Tvert imot, kan det kode nøyaktig for det som gjør arten annerledes. Mattick et al. siterer en rekke andre bevislinjer som antyder at disse ikke-proteinkodende RNA-ene er funksjonelle:
Bilde 4. En seiglivet myte er i ferd med å avgå ved døden
"Loci som uttrykker IncRNA viser mange av egenskapene til proteinkodende gener, inkludert promotorer, flere eksoner, alternativ spleising, karakteristisk kromatinsignaturer, regulering av morfogener og konvensjonelle transkripsjonsfaktorer, endret uttrykk i kreft og andre sykdommer, og et utvalg av halvdeler som ligner på mRNA -er.
Det begrensede uttrykket av lncRNA i forskjellige celler i forskjellige utviklingsstadier og deres generelt lave kopieringsantall (på grunn av deres regulatoriske natur) står for deres sparsomme representasjon i bulkvev RNA-sekvenserings-datasett, mens mange IncRNA er relativt enkle å oppdage i bestemte celler."
Det kan med andre ord være vanskelig å oppdage funksjonene til disse ikke-proteinkodende RNA-ene fordi de bare er aktive eller funksjonelle i bestemte celletyper og bare i bestemte stadier av livssyklusen. Men transkripsjonen deres er neppe tilfeldig. Det virker faktisk nøye kontrollert og orkestrert, lik hvordan proteinkodende DNA er regulert. Det evolusjonsdrevne søppel-DNA-paradigmet forhindret oss i å gjenkjenne viktigheten av disse RNA-genene. Heldigvis er imidlertid flere og flere biologer som John Mattick villige til å følge bevisene dit de fører. Så vidt jeg vet, er Mattick ikke en talsmann for intelligent design. Men gitt måten evolusjonsforskere ofte er imot de som utfordrer regjerende paradigmer, skal han berømmes for sitt mot.
Bilde 5. Casey Luskin
Associate Director, Center for Science and Culture
Casey Luskin er geolog og advokat med høyere grader i vitenskap og jus, og gir ham ekspertise i både de vitenskapelige og juridiske dimensjonene av debatten om evolusjon. Han fikk sin doktorgrad i geologi fra University of Johannesburg, og BS- og MS-grader i geovitenskap fra University of California, San Diego, hvor han studerte evolusjon mye på både høyere og lavere nivå. Hans jusgrad er fra University of San Diego, hvor han fokuserte studiene på First Amendment law, utdannings-lovgivning og miljørett.
Oversettelse via google oversetter og bilder ved Asbjørn E. Lund